Prof. Dr. Holger Rauhut
Professor
Mathematisches Institut der Universität München
Büroadresse:
Theresienstr. 39
Raum B420
80333 München
Sprechstunde:
nach Vereinbarung
Postanschrift:
Theresienstr. 39
80333 München
Professor
Mathematisches Institut der Universität München
Büroadresse:
Theresienstr. 39
Raum B420
80333 München
Sprechstunde:
nach Vereinbarung
Postanschrift:
Theresienstr. 39
80333 München
Ich arbeite an den mathematischen Grundlagen der Informationsverarbeitung, d. h. maschinellem Lernen und Signalverarbeitung. Mein besonderes Interesse gilt Konvergenztheorie für Trainingsalgorithmen (Gradientenabstieg und Varianten) im Deep Learning, Deep Learning für inverse Probleme und Compressive Sensing.
Keywords
Mathematics of Deep Learning | Compressive Sensing
Methoden des Deep Learning bilden die Grundlage für moderne Anwendungen des maschinellen Lernens und der Künstlichen Intelligenz. Trotz der vielen Erfolge und Fortschritte in sehr vielen Bereichen sind die mathematischen Grundlagen bislang nur zum Teil verstanden und es ist oft nicht klar, weshalb die Methoden funktionieren bzw. wann sie funktionieren. Insbesondere fehlen oft rigorose mathematische Garantien für den Erfolg von Lernalgorithmen. Ich versuche in meiner Forschung Fortschritte beim mathematischen Verständnis von Deep Learning zu erzielen.
Ich beschäftige mich dabei mit mehreren Teilbereichen der Mathematik des Deep Learning:
Compressive Sensing ist ein Teilgebiet der mathematischen Signalverarbeitung. Das Grundproblem besteht, Signale anhand möglichst weniger Messungen zu rekonstruieren. Mathematisch führt das dazu, ein unterbestimmtes Gleichungssystem zu lösen. Um Rekonstruktion möglich zu machen wird benutzt, dass in der Praxis Signale oft komprimierbar sind, d.h. gut durch einen dünnbesetzten (sparse) Vektor approximierbar sind. Die Theorie des Compressive Sensing stellt effiziente Rekonstruktionsalgorithmen (z.B. l1-Minimierung) bereit. Interessanterweise sind beweisbar optimale Messmatrizen (die den linearen Messprozess beschreiben) Zufallsmatrizen. Für solche Matrizen können Garantien für die minimal benötigte Anzahl an Messungen (in Abhängigkeit der Signallänge und der Sparsity, d.h. der Anzahl an nichtverschwindenden Koeffizienten) angegeben werden. Für die mathematische Analyse werden Werkzeuge der hochdimensionalen Wahrscheinlichkeitstheorie verwendet.